#모델 신뢰성

Hacker News • 62일 전

IMP 7

최신 LLM 5개, 실제 팩트체크 67%에서 불일치

해커뉴스에 공유된 연구에 따르면, 최신 프론티어 대형 언어 모델(LLM) 5개가 1,000개의 실제 팩트체크 주장 중 67%에서 서로 다른 결과를 내놓았습니다. 이는 현재의 첨단 AI 모델들조차 복잡한 실제 정보의 진위를 판별하는 데 있어 의견이 크게 엇갈린다는 치명적인 한계를 보여줍니다.

LLM 팩트체크 AI 할루시네이션